Vers une approche statistique pour l'indexation sémantique des documents multilingues
نویسندگان
چکیده
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Vers une approche statistique pour l’indexation sémantique des documents multilingues Farah Harrathi, Catherine Roussey, Loïc Maisonnasse, Sylvie Calabretto
منابع مشابه
Méthode d'apprentissage pour la conversion automatique de documents structurés
Résumé : De plus en plus de sociétés désirent moderniser leur système de gestion de fond documentaire. Le problème qui se pose à ces entreprises concerne la migration de leurs documents vers un format plus ouvert et offrant plus de possibilités. La tâche de conversion est rendue difficile d’une part à cause de la grande hétérogénéité des documents et d’autre part à cause du très grand volume de...
متن کاملUne mesure de similarité contextuelle pour l'aide à la navigation dans un treillis
Extraction et exploitation des annotations contextuelles, Noureddine Mokhtari, Rose Dieng-Kuntz Vers une fouille sémantique des brevets: Application au domaine biomédical, Nizar Ghoula, Khaled Khelif, Rose Dieng-Kuntz Utilisation du Web Sémantique pour la gestion d’une liste de diffusion d’une CoP, Bassem Makni, Khaled Khelif, Hacène Cherfi, Rose Dieng-Kuntz Approche d’annotation automatique de...
متن کاملF-CheX : Une approche de fouille dans les documents XML
Résumé. Nous présentons dans cet article une approche de fouille dans les documents XML qui prend en compte la structure et le contenu. Notre approche consiste à effectuer un clustering sur les documents XML. Ces derniers sont représentés par des ensembles de chemins conservant la structure arborescente des éléments. Les ensembles de chemins sont mappés dans une matrice sur laquelle une méthode...
متن کاملEnrichissement d'ontologies grâce à l'annotation sémantique de pages web
Résumé. Nous présentons une approche pour enrichir automatiquement une ontologie à partir d’un ensemble de pages web structurées. Cette approche s’appuie sur un noyau d’ontologie initial. Son originalité est d’exploiter conjointement la structure des documents et des annotations sémantiques produites à l’aide du noyau d’ontologie pour identifier de nouveaux concepts et des spécialisations de re...
متن کاملEtude sémantique des mots-clés et des marqueurs lexicaux stables dans un corpus technique (Semantic Analysis of Keywords and Stable Lexical Markers in a Technical Corpus) [in French]
RESUME ____________________________________________________________________________________________________________ Cet article présente les résultats d’une analyse sémantique quantitative des unités lexicales spécifiques dans un corpus technique, relevant du domaine des machines-outils pour l’usinage des métaux. L’étude vise à vérifier si et dans quelle mesure les mots-clés du corpus techniqu...
متن کامل